<b id="i6d0b"></b>
<wbr id="i6d0b"><menuitem id="i6d0b"></menuitem></wbr>
  • <strong id="i6d0b"></strong>

    <source id="i6d0b"></source>

  • <u id="i6d0b"></u>
  • GoCatal®之多指標貝葉斯優化算法
    2023-12-12
    技術中心

    分享:

    前言 

          在化工研發領域,為制造某種物質或材料,通常需要進行大量的化學實驗去以尋找一種合理高效的最佳合成路徑,而這些實驗中又涉及到多種實驗因素和工藝參數,如溫度、溶劑、催化劑種類、底物濃度等,由于進行實際化學實驗的成本極高(expensive to evaluate),需要消耗大量的實驗材料和資源,因此在巨大的搜索空間中對全量的實驗參數組合一一進行嘗試在經濟上是不切實際的。顯然,如何有效減少實驗嘗試次數,快速高效地得到可使指標達到理想范圍的實驗因素組合,成為化工行業從業人員日益關注的重要問題。

         在該問題上,貝葉斯優化(Bayesian Optimization)就是一種相對較好的解決方案,其是一種用于超參數搜索的方法,已在多個領域表現卓越。如圖1所示,當我們想要最大化某個指標時,隨著貝葉斯優化方法的多輪迭代,其指標值整體呈現上升的趨勢,證明了算法的有效性。

    圖1 單指標貝葉斯優化算法效果展示

         對于化學實驗優化問題,貝葉斯優化算法也可有效地縮短找到較優實驗因素組合的進程。

         但實際上,一方面,一個實驗需要優化的并不僅僅是單個指標,而是會同時存在兩個或兩個以上的多指標(multi-objective),比如不僅要關注產物的收率,還要在此過程中盡可能地控制成本和預算,且很多時候指標之間甚至可以是相互矛盾的,這對于傳統的貝葉斯優化來說是一個巨大的挑戰,因其往往局限在對單個指標的優化上,在指標數增多的情況下適用性降低;另一方面,不同領域不同行業之間的知識背景相差很大,因此照搬經典貝葉斯范式難以取得較好的效果,通常需要結合一定的專業領域內知識和方法,才能更好地發揮出貝葉斯優化的優勢。

       綜上,現實情況的復雜性使得常規的貝葉斯優化算法難以有效地實現需求。

    國工算法優勢

         近期,國工智能基于當下前沿算法,并結合化工領域實際業務背景,將化學科學與人工智能技術深度融合創新(AI for Science),使用計算化學方法和人工智能優化算法相結合的方式,自主研發出了一套針對化學實驗的多指標貝葉斯優化算法。該算法構建概率代理模型(Probabilistic Surrogate Model),通過高斯過程回歸(Gaussian Process Regression)對當前歷史數據進行擬合,并創新性地采用一種更加高效的采集函數,取出使得下一輪對指標改進程度最大的實驗參數組合作為候選樣本。該方法可為用戶快速推薦出合理有效的實驗因素組合。

    國工自研實驗優化算法具備以下特點和優勢:

    • 多指標綜合優化:傳統貝葉斯優化往往局限在優化單個指標,不適用于同時含有多個待優化指標的復雜現實情境,國工自研算法在傳統貝葉斯優化的基礎之上,緊跟國內外研究前沿,擴展了貝葉斯優化的適用場景,能夠有效地支持多指標優化任務。另外考慮到用戶對多個指標可能有著不盡相同的關注程度,因此算法也支持為各個指標分配不同的優化權重,實現實驗信息個性化靈活配置;

    • 支持離散實現數據:貝葉斯優化通常在連續空間中表現良好,但離散或混合空間中欠佳,國工自研算法可以接受實驗因素的不同類型取值,連續型和離散型均可進行處理;

    • 極值判斷:包括貝葉斯在內的許多優化算法,常常存在著固有的對極值判斷的局限性,國工考慮結合計算化學領域的專業知識和方法(如勢能面構建)等,對合理的極值判斷加以支持。例如,當進行了200次或更多次的實驗后,發現其實在第100次時已然達到了最優結果,但單純靠算法本身是無法知曉的,因此我們可以通過勢能面構建、能壘計算等計算化學的方法,與貝葉斯優化算法相結合,更加高效地判斷到達極值的時點,從而將所需的嘗試次數進一步降低;

    • 自動擬合修正:隨著實驗數據不斷積累,模型對于真實的概率分布也將擬合得越來越好,通過不斷修正更新先前的概率代理模型及采集函數,我們的算法將會推薦出更加合理有效的候選方案供用戶選擇;

       

         總結:綜上所述,國工自研多指標實驗優化算法能夠適用于多種復雜應用場景,顯著減少實驗人員進行嘗試的次數,節約時間和成本。

    案例分析
        下面將結合一個具體的案例來對該算法進行說明。需要指出的是,這里我們以三因素雙指標為例進行演示,但算法本身并不局限于待優化指標數以及各因素的取值個數。

         首先,打開國工智能數據大腦平臺,進入實驗優化界面,對實驗信息進行配置。使用的指標分別是收率和成本,要求收率最大化及成本最小化,并可分配指標的權重,如圖2。

    圖2 實驗指標配置

         此外,還需對實驗因素進行配置,這里我們利用溫度、壓強、催化劑這三個因素,配置好各自可取的因素值以及單位,對于連續型值,用戶還可以按照范圍進行輸入。配置完因素后點擊完成配置按鈕即可,也可導入已有實驗配置信息。

         其次,實驗信息配置完成后,即可開始進行算法優化。在首輪沒有歷史數據的情況下,需要隨機從搜索空間中生成用戶指定個數的初始樣本,這里以5個為例,如圖3為輪次1的信息,這里的收率及成本實際值需要做實驗進行回填,用戶也可以根據自己的需求刪除一些樣本。

    圖3 初始化歷史數據

         將各方案指標值填充后,點擊方案推薦按鈕,算法會讀入輪次1的數據并推薦出用戶指定個數的方案,這里仍以推薦5個為例,如圖4,在輪次2中,算法提供了5組實驗因素組合,同樣的,用戶可做實驗對指標值進行回填。

    圖4 算法推薦方案

         最后,按照上述流程,將算法循環迭代多輪,對每輪推薦出的方案進行實驗回填,直至兩個指標均達到理想范圍或者已經枚舉出了所有的組合方案為止。為符合業務場景,我們還在算法內部增添了去重的功能,因此不會推薦出與歷史數據重復的方案,且每輪推薦完成后,還可以點擊實驗分析對推薦效果進行可視化,也可將方案導出為excel文件作其他用途。

        下圖為本示例最終推薦效果的可視化展示,取出每輪推薦方案中指標值較優的點繪制折線圖,雖有所波動,但收率整體上朝著最大化的方向進行優化,同時成本也在逐漸最小化,并在第5輪推薦方案中二者均達到了可以接受的水平,證實了該算法的有效性。

    圖5 多指標優化算法效果

    適用場景

     

    • 1.化工、材料、醫藥等領域需要進行大量實驗的工廠實驗室以及各大高校配備的實驗室等;

    • 2.目前國工智能催化劑智能研發平臺GoCatal®已集成部署了多個功能模塊,可便捷地處理很多化工場景下的特定問題,該多指標貝葉斯實驗優化算法可與其他組件協同,更好地實現客戶的需求。

       

     

    專利證書


     

    相關標簽

    業務咨詢
    亚洲国产天堂女人午夜看片